Von Mediatoren über Ontologien zu Linked Open Data-Zum Stand der Informationsintegration und -fusion aus Sicht der Life Sciences

نویسنده

  • Kai-Uwe Sattler
چکیده

Die Verknüpfung von Daten aus unterschiedlichen Quellen ist in vielen Anwendungsbereichen eine zentrale Aufgabe. In den vergangenen 25 Jahren wurde daher eine Vielzahl von Ansätzen zur Lösung dieses Problems entwickelt. Während jedoch im Business-Bereich Data-Warehouse-Systeme als Integrationsplattform fest etabliert sind, stellen die Lebenswissenschaften besondere Anforderungen. So wurden in den letzten Jahren unzählige wissenschaftliche Datensammlungen veröffentlicht und über das Internet zugänglich gemacht, die in verschiedenster Weise genutzt werden können. Eine Verknüpfung und übergreifende Analyse der Daten wird jedoch durch Systemgrenzen und Heterogenitäten erschwert. Benötigt werden daher Techniken zur Informationsintegration, die nicht nur einen transparenten Zugriff auf Daten aus anderen Systemen ermöglichen, sondern auch komplexe Extraktions-, Transformationsund Analyseschritte automatisieren können und dabei die Charakteristika der Daten wie Qualität, Kontext und Vertraulichkeit berücksichtigen. Der Beitrag gibt einen Überblick zum Stand der Forschung im Bereich Informationsintegration und betrachtet neben klassischen Datenbanktechniken auch aktuelle Ansätze zur semantischen Integration und Fusion. Im Mittelpunkt stehen dabei die Eignung für Life-Science-Anwendungen sowie die speziellen Herausforderungen dieser Domäne.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Drahtlose Sensornetze: Quo Vadis?

Seit drahtlose Sensornetze als Konzept zur Umweltbeobachtung gegen Ende des vergangenen Jahrhunderts das Interesse kalifornischer Wissenschaftler weckten, sind auf diesem Gebiet wichtige Fortschritte erzielt worden. Weltweit haben eine Vielzahl von Forschungsgruppen die Grundlagen gelegt, die heute Pilotinstallationen von bis zu mehreren hundert drahtlos vernetzten Sensorknoten ermöglichen, die...

متن کامل

Drying up the data swamp - Vernetzung von Daten mittels iQser GIN Server

In vielen Unternehmen laufen heute heterogene Daten aus vielfältigen Quellen in Data Lakes zusammen, die immer mehr zu Data Swamps verkommen. Oft ist nicht bekannt, was sich in den zahlreichen Datentöpfen befindet und in welcher Qualität die Daten tatsächlich vorliegen. Typische Big Data Technologien wie zum Beispiel Hadoop alleine bieten kaum eine Möglichkeit, diesem Chaos Herr zu werden. Imme...

متن کامل

Computer als Medium. Workshop an der Universität Lüneburg

Vom 15. bis 17. Juli 1993 fand im Rechenzentrumder Universität Lüneburg ein Workshop über "Computer als Medium" statt. Veranstalter waren die Fachgruppe "Computer als Medium" der Gesellschaft für Informatik und das Labor Kunst und Wissenschaft an der Universität Lüneburg. Der Workshop ist der dritte in einer Reihe von Veranstaltungen, über die an dieser Stelle bereits berichtet wurde. Das Thema...

متن کامل

Datenqualität durch inhaltsbezogene Referenzierung

Ein Aspekt der Datenqualität bei der Integration verschiedener Dokumentfragmente zu einem neuen Dokument ist die Korrektheit der inhaltlichen Bezüge zwischen den Fragmenten. Wir zeigen, wie mit Hilfe von ontologisch repräsentiertem Wissen über Struktur und Inhalt von Dokumenten inhaltliche Bezüge so spezifiziert werden können, dass ihre Korrektheit in dynamisch zusammengestellten Dokumenten aut...

متن کامل

Demonstration von Bildverarbeitung und Sprachverstehen in der Dienstleistungsrobotik

Zusammenfassung Die typischerweise gewünschten Einsatzgebiete für Dienstleistungsroboter, z. B. Krankenhäuser oder Seniorenheime, stellen sehr hohe Anforderungen an die Mensch-Maschine-Schnittstelle. Diese Erfordernisse gehen im Allgemeinen über die Möglichkeiten der Standardsensoren, wie Ultraschalloder Infrarotsensoren, hinaus. Es müssen daher ergänzende Verfahren zum Einsatz kommen. Aus der ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010